Données semi-structurées. Découverte, maintenance et analyse de tendances

نویسندگان

  • Pierre-Alain Laur
  • Maguelonne Teisseire
  • Pascal Poncelet
چکیده

Mining knowledge from structured data has been extensively addressed in the few past years. However, with the growing popularity of the Web, the number of semi structured documents available is rapidly increasing and it is judicious to assume that a query on document structure is almost as important as a query on data. In this paper, we propose an approach to extract such structures. Moreover, manipulated data is constantly being updated; we extend our approach to take into account source evolutions in a knowledge extraction process. Finally, we show that it is possible to analyze trends during the different data sources evolutions. MOTS-CLÉS : données semi structurées, extraction de connaissances, évolutions des sources de données, tendances.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un premier pas vers la modelisation des donnees semi-structurees par la logique multi-modale hybride

RÉSUMÉ. Les documents XML et les données semi-structurées peuvent être représentées par des graphes étiquetés. Dans cet article, nous établissons un lien direct entre ces graphes de données et les modèles d’un langage de la logique multi-modale hybride. Ce lien est ensuite exploré dans deux directions. Tout d’abord, nous nous intéressons à l’expression de contraintes d’intégrité sur des données...

متن کامل

Approche Fouille de Texte pour la détection précoce de tendances économiques

Résumé. Cet article présente un retour d’expérience sur de la fouille de données complexes dans un processus d’extraction des connaissances dans un contexte industriel. Á partir de données volumineuses non structurées issues de dépêches d’actualités économiques et selon certains traitements linguistiques et économétriques, notre objectif est de prédire des tendances économiques dans des séquenc...

متن کامل

Des séquences aux tendances

RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à l...

متن کامل

Méthodes à noyaux appliquées aux textes structurés

Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...

متن کامل

Règles graduelles et cubes de données : quand les blocs s'empilent !

Résumé. Le couplage des méthodes de fouille de données et d’entrepôts de données permet d’extraire des informations pertinentes à partir de cubes de données. Dans ce contexte, de nombreuses approches ont été proposées, permettant par exemple d’extraire des règles d’association ou des motifs séquentiels. Cependant, il n’existe pas de méthodes permettant d’extraire des règles graduelles. Dans cet...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Ingénierie des Systèmes d'Information

دوره 8  شماره 

صفحات  -

تاریخ انتشار 2003